AI资讯新闻榜单内容搜索-Diffusion

360AI推出DiT架构下"省钱版"ControlNet, 参数量骤减85%性能达到SOTA！

现有的可控Diffusion Transformer方法，虽然在推进文本到图像和视频生成方面取得了显著进展，但也带来了大量的参数和计算开销。

来自主题: AI技术研报

8218 点击 2025-03-03 10:06

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

Diffusion Transformer模型模型通过token粒度的缓存方法，实现了图像和视频生成模型上无需训练的两倍以上的加速。

来自主题: AI技术研报

8117 点击 2025-02-28 15:06

被Github 上的Stable Diffusion 坑惨了？失业、欠帐、恐慌，工程师怒喷：AI软件毁了我

这位曾用代码构建童话世界的工程师，被困在了由 AI 工具引发的一场噩梦里。

来自主题: AI资讯

7637 点击 2025-02-28 10:27

千帧长视频时代到来！MIT全新扩散算法让任意模型突破时长极限

进入到 2025 年，视频生成（尤其是基于扩散模型）领域还在不断地「推陈出新」，各种文生视频、图生视频模型展现出了酷炫的效果。其中，长视频生成一直是现有视频扩散的痛点。

来自主题: AI技术研报

8503 点击 2025-02-26 13:39

CityDreamer4D: 下一个世界模型，何必是视频生成模型？

在过去的两年里，城市场景生成技术迎来了飞速发展，一个全新的概念 ——世界模型（World Model）也随之崛起。当前的世界模型大多依赖 Video Diffusion Models（视频扩散模型）强大的生成能力，在城市场景合成方面取得了令人瞩目的突破。然而，这些方法始终面临一个关键挑战：如何在视频生成过程中保持多视角一致性？

来自主题: AI技术研报

8068 点击 2025-01-28 11:53

生成越长越跑偏？浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

本文介绍了一篇由浙江大学章国锋教授和商汤科技研究团队联合撰写的论文《StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation》。

来自主题: AI技术研报

9711 点击 2025-01-17 11:14

终于等来能塞进手机的文生图模型！十分之一体量，SnapGen实现百分百的效果

近些年来，以 Stable Diffusion 为代表的扩散模型为文生图（T2I）任务树立了新的标准，PixArt，LUMINA，Hunyuan-DiT 以及 Sana 等工作进一步提高了图像生成的质量和效率。然而，目前的这些文生图（T2I）扩散模型受限于模型尺寸和运行时间，仍然很难直接部署到移动设备上。

来自主题: AI技术研报

9132 点击 2024-12-25 14:02